03. Connect Zeppelin

  • Apache Zeppelin은 Spark, SQL, Python, Scala, R, Hive 등 정말 다양한 언어들을 제공해주고 있는 도구로, Notebook 형태를 띄고 있습니다
  • 쿼리의 결과를 빠르게 시각화할 수 있는 장점을 가지고 있습니다
  • Dynamic Form을 구성할 수 있습니다
  • Zeppelin도 python의 경우와 마찬가지로 GOOGLE_APPLICATION_CREDENTIALS 설정이 필요합니다! ( 설정만 하면 끝-! )
  • Zeppelin Install Document를 통해 제플린을 설치해주세요! (본 문서에서 설치에 대해선 다루지 않겠습니다)
    설치 후, 
    cd zeppelin_folder
    bin/zeppelin-daemon.sh start
    http://localhost:8080/

  • Apache Zeppelin의 메인 화면

  • anonymous라고 되어있는 곳을 클릭한 후, Interpreter를 클릭해주세요!

  • 매직 커맨드는 %bigquery
  • 해당 화면에서 최대 rows 수, project_id, wait_time을 설정할 수 있습니다

  • %bigquery 매직커맨드만 설정해주면 그냥 바로 쿼리문을 작성하면 결과가 뿅!하고 나옵니다
  • 네모로 친 부분에서 데이터를 바로 시각화할 수 있습니다

막대 그래프

파이 그래프

그래프

  • 제플린의 경우 바로 시각화를 보여주기 때문에 대시보드로 사용하기도 좋고, 데이터 탐색에도 용이합니다!